14. 文本:回归闭式解
我们要怎么找出拟合得最好的回归线?
正如你在上个视频看到的,在求回归解时,我们会想最小化下列函数:
\sum\limits_{i=1}^n(y_i - \hat{y}_i)^2
看来,为了最小化该函数,我们需要列出等式来求截距和斜率。
比如你得到了如图的一系列数值点:

为了得到斜率和截距,我们需要进行如下计算:
\bar{x} = \frac{1}{n}\sum x_i
\bar{y} = \frac{1}{n}\sum y_i
s_y = \sqrt{\frac{1}{n-1}\sum\limits(y_i - \bar{y})^2}
s_x = \sqrt{\frac{1}{n-1}\sum\limits(x_i - \bar{x})^2}
r = \frac{\sum\limits_{i=1}^n(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum(x_i - \bar{x})^2}\sqrt{\sum(y_i - \bar{y})^2}}
b_1 = r\frac{s_y}{s_x}
b_0 =\bar{y} - b_1\bar{x}
但在你开始计算之前……
虽然你现在完全能进行这些步骤……
但在计算机时代,全部都用手工计算实在没有必要,利用好计算机,我们就能集中精力来解释结果并根据结果进行决策,如果你想观察 Excel 是怎么一步步进行这些计算的,那你可以看 这里 ,在接下来的课程中,你将在 Python 里做些相关练习。